智能论文笔记

PCQA-GRAPHPOINT: Efficients Deep-Based Graph Metric For Point Cloud Quality Assessment

Marouane Tliba , Aladine Chetouani , Giuseppe Valenzise , Frederic Dufaux

分类：计算机视觉

2022-11-04

Following the advent of immersive technologies and the increasing interest in representing interactive geometrical format, 3D Point Clouds (PC) have emerged as a promising solution and effective means to display 3D visual information. In addition to other challenges in immersive applications, objective and subjective quality assessments of compressed 3D content remain open problems and an area of research interest. Yet most of the efforts in the research area ignore the local geometrical structures between points representation. In this paper, we overcome this limitation by introducing a novel and efficient objective metric for Point Clouds Quality Assessment, by learning local intrinsic dependencies using Graph Neural Network (GNN). To evaluate the performance of our method, two well-known datasets have been used. The results demonstrate the effectiveness and reliability of our solution compared to state-of-the-art metrics.

translated by 谷歌翻译

A domain adaptive deep learning solution for scanpath prediction of paintings

Mohamed Amine Kerkouri , Marouane Tliba , Aladine Chetouani , Alessandro Bruno

分类：计算机视觉

2022-09-22

文化遗产的理解和保存对于社会来说是一个重要的问题，因为它代表了其身份的基本方面。绘画代表了文化遗产的重要组成部分，并且是不断研究的主题。但是，观众认为绘画与所谓的HVS（人类视觉系统）行为严格相关。本文重点介绍了一定数量绘画的视觉体验期间观众的眼动分析。在进一步的详细信息中，我们引入了一种新的方法来预测人类的视觉关注，这影响了人类的几种认知功能，包括对场景的基本理解，然后将其扩展到绘画图像。拟议的新建筑摄入图像并返回扫描路径，这是一系列积分，具有引起观众注意力的很有可能性。我们使用FCNN（完全卷积的神经网络），其中利用了可区分的渠道选择和软弧度模块。我们还将可学习的高斯分布纳入网络瓶颈上，以模拟自然场景图像中的视觉注意力过程偏见。此外，为了减少不同域之间的变化影响（即自然图像，绘画），我们敦促模型使用梯度反转分类器从其他域中学习无监督的一般特征。在准确性和效率方面，我们的模型获得的结果优于现有的最先进的结果。

translated by 谷歌翻译

SalyPath360: Saliency and Scanpath Prediction Framework for Omnidirectional Images

Mohamed Amine Kerkouri , Marouane Tliba , Aladine Chetouani , Mohamed Sayeh

分类：计算机视觉

2022-01-01

本文介绍了一种新的框架，以预测全向图像的视觉注意。我们的体系结构的关键设置是同时预测给定刺激的显着图和相应的扫描路径。该框架实现了一个完全编码器 - 解码器卷积神经网络，由注意模块增强以生成代表性显着图。另外，采用辅助网络通过SoftArgMax函数来生成可能的视口中心固定点。后者允许从特征映射派生固定点。为了利用扫描路径预测，然后应用自适应联合概率分布模型来通过利用基于编码器解码器的显着性图和基于扫描路径的显着热图来构建最终的不偏不倚的显着性图。在显着性和扫描路径预测方面评估所提出的框架，并将结果与Salient360上的最先进方法进行比较！数据集。结果表明，我们的框架和这种架构的益处的相关性，用于进一步全向视觉注意预测任务。

translated by 谷歌翻译

A Simple and efficient deep Scanpath Prediction

Mohamed Amine Kerkouri , Aladine Chetouani

分类：计算机视觉

2021-12-08

Visual ScanPath是人类凝视在观察图像时行进的固定点序列，其预测有助于建模图像的视觉注意。为此，使用复杂的深度学习架构和框架在文献中提出了多种模型。在这里，我们以简单的完全卷积回归方式探讨使用共同的深度学习架构的效率。我们尝试这些模型可以在2个数据集上预测扫描路径的程度。我们与使用不同指标的其他模型进行比较，并显示有时超越以前复杂的架构的竞争结果。我们还根据实验的表演比较不同的杠杆骨干架构，推断哪些是最适合任务的。

translated by 谷歌翻译

Overcoming Referential Ambiguity in Language-Guided Goal-Conditioned Reinforcement Learning

Hugo Caselles-Dupré , Olivier Sigaud , Mohamed Chetouani

分类：机器学习 | 自然语言处理

2022-09-26

解释中的歧义可以很容易地阻碍使用自然语言执行新任务的代理人。当老师通过参考对象的特征向学习者提供有关对象的指导时，学习者可以误解老师的意图，例如，如果指令模棱两可地指对象的特征，则是一种称为参考歧义的现象。我们研究了从认知科学中得出的两个概念如何帮助解决这些参考歧义：教育学（选择正确的说明）和实用主义（使用归纳推理学习其他代理的偏好）。我们将这些想法应用于教师/学习者的设置，并在模拟机器人任务（堆栈）中使用两个人工代理。我们表明，这些概念提高了培训学习者的样本效率。

translated by 谷歌翻译

Pragmatically Learning from Pedagogical Demonstrations in Multi-Goal Environments

Hugo Caselles-Dupré , Olivier Sigaud , Mohamed Chetouani

分类：机器学习

2022-06-09

从演示方法中学习通常利用接近最佳示范的方法来加速培训。相比之下，在展示任务时，人类教师会偏离最佳示威活动，并通过提供最佳歧视他们想要展示的目标的演示来改变其行为。类似地，人类的学习者在务实地推断老师的意图方面表现出色，从而促进了两个代理商之间的沟通。在少数示威制度中，这些机制至关重要，在少数示威制度中，推断目标更加困难。在本文中，我们通过利用示威活动的贝叶斯推断贝叶斯模型来实施教学法和实用主义机制。我们在多进球教师学习者的设置中强调了该模型的好处，并使用两个人工代理人通过目标条件的强化学习来学习。我们表明，将教学老师和务实的学习者结合起来会导致学习速度更快，并减少了从演示中进行标准学习的目标歧义，尤其是在少数示威制度中。

translated by 谷歌翻译